ISO 639-3

ISO 639-3:2007 - Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages - là tiêu chuẩn nằm trong chuỗi tiêu chuẩn quốc tế ISO 639 do Tổ chức Tiêu chuẩn hóa Quốc tế ban hành dành cho mã ngôn ngữ. Mỗi mã ISO 639-3 gồm ba chữ cái dùng để nhận diện ngôn ngữ. ISO 639-3 mở rộng các mã alpha-3 của ISO 639-2 nhằm mục đích bao quát toàn bộ các ngôn ngữ tự nhiên đã biết trên thế giới. Tiêu chuẩn này được ban hành vào ngày 5 tháng 2 năm 2007.[1]ISO 639-3 hướng đến nhiều đối tượng sử dụng, cụ thể là các hệ thống máy tính có nhu cầu hỗ trợ nhiều ngôn ngữ. Tiêu chuẩn này cung cấp một bảng liệt kê ngôn ngữ hoàn chỉnh nhất có thể được, bao gồm các ngôn ngữ cả sống lẫn chết, cả cổ lẫn được xây dựng, cả lớn và nhỏ, cả ngôn ngữ có chữ viết lẫn không có chữ viết.[1] Tuy nhiên, nó không bao hàm các ngôn ngữ tái cấu trúc, chẳng hạn ngôn ngữ Tiền Ấn-Âu.[2]ISO 639-3 là một siêu tập hợp (superset) của ISO 639-1 và của các ngôn ngữ đơn lẻ trong ISO 639-2. ISO 639-1 và ISO 639-2 tập trung vào các ngôn ngữ lớn thường xuyên có mặt trong tổng thể kho tài liệu của thế giới. Do ISO 639-2 bao gồm các tập hợp ngôn ngữ trong khi ISO 639-3 lại không có nên ISO 639-3 không phải là một siêu tập hợp của ISO 639-2. Ngoài ra, ISO 639-3 chỉ dùng mã "thuật ngữ" (xem thêm ISO 639-2) so với ISO 639-2 dùng cả mã "thư mục" và mã "thuật ngữ".Tính đến tháng 4 năm 2012, tiêu chuẩn ISO 639-3 có 7.776 mục.[3] Con số này đạt được là nhờ dựa trên nhiều nguồn khác nhau, bao gồm: các ngôn ngữ đơn lẻ trong ISO 639-2, các ngôn ngữ hiện đại trích từ xuất bản phẩm Ethnologue, các biến thể mang tính lịch sử, các ngôn ngữ cổ và các ngôn ngữ được xây dựng rút từ cơ sở dữ liệu Linguist List của nhà ngôn ngữ học Anthony Aristar cũng như các ngôn ngữ do công chúng đề xuất trong các buổi thu thập ý kiến phản hồi.